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Abstract of FR 2802671 (A1) 

The method uses a server with a Web address 
which executes the search and generates 
documents, the results of the file address search 
including the Web address of the search result 
indicating the placement of files spread amongst 
interconnected Internet servers and the generation 
of the document indicating the search results. 
Method for classifying searched for data files which 
has the following stages: (a) association of a key 
word with each file, a physical location for each file 
being addressed by a file address; association of an 
audience indice with at least a pair comprising the 
file address and key word. A file address can have 
several associated key words and an audience 
indice for each file address and key word pair; 
execution of a search request with search key 
words; reception of search results for file addresses 
which have at least an associated key word which 
corresponds to at least a search key word in 
response to the search request, and; classification 
of the results as a function of the audience indice 
associated with each file address and key word pair 
in which the key word corresponds the search key 
word. 
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METHODE, SYSTEME ET PRODUIT POUR CLASSER DES RESULTATS DE RECHERCHE A L'AIDE DUN 
INDICE D'AUDIENCE. 



La presente invention concerne une methode, un sys- 
teme, un produit et des structures de donnees pour classer 
des fichiers informatiques qui font I'objet d'une recherche. 
Au moins un mot cle est associe avec chaque fichier. Un 
emplacement physique de chaque fichier est identifie par 
une adresse de fichier telle qu'une adresse Web. Un indice 
d'audience est associe avec au moins une paire constitute 
d'une adresse de fichier et d'un mot cle, de telle sorte 
qu'une adresse de fichier peut avoir plusieurs mots cles as- 
socies et un indice d'audience associe pour chaque paire 
constitute d'une adresse de fichier et d'un mot cle. En 5 re- 
ponse a I'execution d'une demande de recherche avec des 
mots cles, I'utilisateur recoit des resultats qui ont au moins 
un mot cle associe qui correspond a au moins un mot cle de 
la recherche. Les resultats de la recherche sont classes se- 
lon I'indice d'audience associe a chaque paire constitute 
d'un resultat et d'un mot cle dont le mot cle correspond a ce- 
lui de la recherche. Un document est ensuite code de ma- 
niere a comprendre les resultats de la recherche d'adresses 
de fichier et a les afficher conformement a la classification. 
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DOMAINE TECHNIQUE 

La presente invention concerne une methode, un systeme et 
unproduit pour chercher des adresses de fichier telles que, p. 
ex des URLs ou adresses Web et classer les resultats des 
5 recherches a l'aide d ' un indice d'audience indiquant la 
frequence de la selection des adresses Web parmi les resultats 
de la recherche renvoyes. 

ETAT ACTUEL DE LA TECHNIQUE 

Pour trouver des documents sur Internet, les utilisateurs 
0 utilisent generalement un moteur de recherche Internet. 
L'utilisateur entre un ou plusieurs mots cles et indique 
eventuellement des operateurs booleens pour la recherche, puis 
transmet la demande de recherche a un serveur menu d'un moteur 
de recherche. Les moteurs de recherche comprennent un 
5 programme dit "spider" ou "crawler" soit un moteur de balayage 
qui visite regulierement les pages web sur Internet pour 
reperer les nouvelles pages web et verifier les sites deja 
reperes afin de deceler les modifications. Le moteur de 
balayage place ensuite les informations des pages qu'il a 
20 reperees dans un index de base de donnees qui relie les 
adresses Web aux termes de recherche. 

Les moteurs de recherche peuvent indexer differentes 
informations des pages reperees pour les associer aux adresses 
Web reperees. De nombreux moteurs de recherche indexent 
25 1' ensemble du texte visible mais peuvent exclure des mots 
courants tels que, p. ex., "le", "et", etc. Les moteurs de 
recherche peuvent aussi indexer des mots cles figurant dans un 
"meta tag" c'est a dire un marqueur meta special du document 
qui comprend des mots cles que le createur de la page a prevus 
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pour la recherche. Les moteurs de recherche peuvent inclure 
d'autres textes associes a des images ou chercher des racines 
de mots pour inclure des variations telles que, p. ex., 
politique, politicien, politiquement , etc. comme mots cles 
5 dans 1' index. Les mots cles indexes pour une adresse Web 
donnee sont ensuite recherches lorsqu'un utilisateur les entre 
pour effectuer une recherche. Le resultat d T une recherche 
comprend toutes les adresses Web qui possedent des mots 
indexes correspondant aux termes de la recherche et aux 
10 operateurs booleens eventuels. 

Un moteur de recherche peut donner en reponse a une 
question d f un utilisateur de nombreux resultats dont beaucoup 
ne sont pas pertinents. Un des problemes auxquels les 
developpeurs de moteurs de recherche doivent faire face est 
15 l T ordre dans lequel les resultats des recherches doivent etre 
presentes. La plupart des moteurs de recherche utilisent 
1 1 emplacement et la frequence des mots cl6s sur la page web 
comme base de classification des resultats de la recherche. 
D'autres moteurs de recherche peuvent favoriser un ordre 

20 d'affichage des pages particulier si des mots cles sont inclus 
dans les marqueurs meta de la description et des mots cles de 
la page. Un moteur de recherche peut aussi favoriser la 
pertinence en fonction du nombre de pages et/ou de pages web 
importantes qui comprennent des liens hypertexte avec la page 

25 des resultats de la recherche. 

La reponse a une demande est souvent determinee par la 
maniere dont les mots cles sont indexes pour une adresse Web. 
Les fournisseurs de moteurs de recherche controles par les 
auteurs permettent a ceux-ci de designer les mots cles indexes 

30 en les specifiant dans les documents. D'autres fournisseurs 
de moteurs de recherche utilisent une approche de controle par 
les editeurs; ils emploient alors des editeurs pour cataloguer 
manuellement les sites web et les mots cles indexes qui seront 
utilises dans la recherche. Les moteurs de recherche qui 

35 s'appuient sur les auteurs permettent a ceux-ci d T inclure dans 
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les marqueurs meta des mots trompeurs pour forcer le moteur de 
recherche a renvoyer le document en reponse a des recherches 
sans relation avec son contenu. Les moteurs de recherche 
controles par les editeurs peuvent aboutir a des resultats non 
5 pertinents si les editeurs associent des mauvais mots cles aux 
adresses Web ou excluent des mots cles tres pertinents de 
1 f association adresse Web/mot cle. 



Pour ameliorer la presentation des resultats, une societe 
produisant des moteurs de recherche, Direct Hit, a developpe 

10 des algorithmes pour classer les resultats de recherche selon 
1 ! audience des sites. Le moteur de recherche Direct Hit 
controle anonymement les sites web que les chercheurs 
selectionnent dans la liste des resultats, le temps qu'ils 
passent sur ces sites et d'autres parametres. Les sites qui 

15 sont selectionnes par les chercheurs sont mieux classes, a 
1 ' inverse de ceux qui sont regulierement ignores par les 
chercheurs . 



11 y a besoin dans ce domaine d'une rnethode, d'un 
systeme, d ' un programme et de structures de donnees ameliores 
20 pour integrer 1' audience des adresses Web selectionnees dans 
l ! ordre dans lequel les resultats de recherche sont renvoyes 
et affiches sur le poste des chercheurs. 



RESUME DE L' INVENTION 



Pour surmonter les limites de l'etat actuel de la 
25 technique decrit ci-dessus, les versions pref erentielles 
presentent une rnethode, un systeme, un programme et des 
structures de donnees pour classer les fichiers inf ormatiques 
qui font l'objet d'une recherche. Au moins un mot cle est 
associe a chaque fichier. L T emplacement physique de chaque 
30 fichier est identifie par une adresse de fichier. Un indice 
d' audience est associe avec au moins une paire constitute 
d'une adresse de fichier et d'un mot cle, de maniere a ce 
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mot cle associe ^ ~ 1= ,qc;£s selon 

w h« tps resultats de la recherche sont classes 
;:ri C ce .aullence assoc. * cha.e palre construe d - un 
. "tat et <fun .ot cle dont 1. «* d. correspond . „ lu x 
10 la recherche. Un — t est ens^e , co e * 
comprendre lea resultats de la recherche d adresses 
et a les afficher selon le classement. 

-i« ^vsteme recoit une demande 
Dans d'autres versions, le systeme r v 

,Jssi.» . a, moins un des resultats 
15 d , toSS e, de fichier affiches dans X. document Le nd =e 
„. audience sont augments au moins pour la paxre const rtuee 
t un resultat de recherche et d'un mot cle qui correspond au 
Its cles de la recherche. les indices d'audience peuvent 
I;;;;! abaisses pour I., paires constitutes d'une adresse 
20 de fichier et d^un mot cle qui correspondent aux mots cles 
la recherche qui n'ont pas ete demandes. 

Dans les versions sur Internet, un serveur dote d'une 
adr esse web de serveur execute la recherche et 
document. Dans oe cas, les resultats de la recherche 
25 d'adresses de fichier component des adresses Web qui 
indiquent 1 • emplacement de fichiers transmis aux serveurs par 
internet. Le document est genera en combinant !• adresse web 
de serveur avec cheque adresse Web de resultat de recherche 
dans une adresse Web combinee pour cheque resultat de 
30 recherche. Le document est ensuite code pour afficher cheque 
resultat de la recherche avec !• adresse Web eombrnee de 
maniere a ce que les demandes de V adresse Web combinee sorent 
orientees vers le serveur. Lorsqu'une demande de 1'adresse 
„ eb combinee est regue, 1 ' indice d'audience associe avec 
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chaque adresse Web de resultat de recherche de la paire 
constitute de 1' adresse Web combinee et du mot cle 
correspondant aux mots cles de la recherche est augmente. La 
demande est dirigee vers 1' adresse Web de resultat de la 
5 recherche. 

Les versions pref erentielles comprennent une methode, un 
systeme, un programme et des structures de donnees pour 
associer des indices d' audience indiquant la frequence de 
selection, autrement dit 1' audience, d'une adresse Web donnee 

10 provenant des resultats de la recherche. Dans les versions 
pref erentielles, un indice d' audience peut etre associe avec 
chaque paire constitute d'une adresse Web et d'un mot cle pour 
donner des indices d' audience specif iques a chaque mot cle. 
Les indices d' audience sont utilises pour determiner 1 ' ordre 

15 dans lequel les resultats de la recherche sont affiches sur le 
poste du chercheur. Un avantage de la ponderation de 
1' audience des mots cles est que 1' ordre de presentation d'une 
adresse Web donnee dans la reponse a une recherche est base 
sur 1' audience du mot cle de la recherche et non sur 1' adresse 

20 Web en general. En fait une adresse Web peut avoir pour 
differents mots cles des indices d' audience tres differents 
qui indiquent sa pertinence pour les differents mots cles de 
recherche. Ainsi, les versions pref erentielles off rent une 
classification fine basee sur une audience mesuree qui est 

25 specif ique aux mots cles de la recherche et tient compte d'une 
classification des adresses Web etablies par les utilisateurs 
pour des mots cles donnes. 



BREVE DESCRIPTION DES DESSINS 



Reportons-nous maintenant aux dessins sur lesquels les 
30 numeros representent tou jours les memes elements : 
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La FIG. 1 represente un environnement inf ormatique dans 
lequel des versions pref erentielles de la presente invention 
sont installees. 

La FIG. 2 represente une exemple de la maniere dont les 
5 adresses Web, les mots cles et les indices d' audience sont 
associes dans les versions pref erentielles de la presente 
invention . 

Les FIG. 3a et 3b representent la logique implantee dans 
un moteur de recherche pour renvoyer les resultats de 
10 recherche conformement aux versions pref erentielles de la 
presente invention . 

La FIG. 4 represente la logique implantee dans le moteur 
de recherche pour definir les indices d T audience et traiter 
les demandes d' adresses Web resultant de la recherche 
15 conformement aux versions pref erentielles de la presente 
invention . 

DESCRIPTION DETAILLEE DES REALISATIONS DE L r INVENTION 

Dans la description suivante, il est fait reference aux 
dessins d T accompagnement qui en font partie integrante et qui 
20 representent plusieurs versions de la presente invention. II 
est entendu que d f autres versions peuvent etre utilisees et 
des modifications structurelles ou f onctionnelles apportees 
sans sortir de l T objet de la presente invention. 

La FIG. 1 represente un environnement inf ormatique dans 
25 lequel des versions pr6f erentielles sont installees. 
L 1 environnement inf ormatique 2 comprend un serveur a moteur de 
recherche 4, au moins un ordinateur client 6 et des serveurs 
d r inf ormation 8a et 8b qui communiquent sur un reseau 10. Le 
reseau 10 peut etre un reseau TCP/IP, tel que 1 ' Internet ou 
30 World Wide Web, ou n'importe quel autre systeme de reseau 
connu dans le domaine tel que, p. ex., un reseau local (LAN), 
un Ethernet, un grand reseau (WAN) , un reseau systeme (SAN) , 
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un Token Ring, etc. Les serveurs 4, 8a et 8b et 1'ordinateur 
client 6 peuvent aussi cornmuniquer par des reseaux separes. 

Tous les systemes 4, 6, 8a et 8b communiquent a 1'aide 
d'un protocole de transfert de document tel que le Hypertext 

5 Transfer Protocol (HTTP), ou tout autre protocole de transfert 
de document connu dans le domaine tel que FTP, Gopher, WAIS, 
etc. Le client 6 contient un programme d ' exploration tel 

qu'un navigateur HTML, capable de transmettre des demandes a 
l'aide du protocole HTTP d f une maniere connue dans le domaine. 

10 Si le client 6 demande 1* adresse Web au serveur a moteur de 
recherche 4, ce dernier renvoie une page HTML dans laquelle 
l'utilisateur sur le poste client 6 peut entrer des mots cles 
pour effectuer une recherche sur Internet 10. 

Le serveur a moteur de recherche 4 contient un programme 
15 de recherche 12 qui effectue des operations de moteur de 
recherche connues dans le domaine, telles que la recherche de 
pages web et 1' indexation des adresses Web des pages web avec 
des mots cl6s dans un index d f adresse Web 14. Lorsque le 
client 6 envoie une demande de recherche au serveur a moteur 
20 de recherche 4, le moteur de recherche 12 interroge 1 1 index 
d T adresse Web 14 d'une maniere connue dans le domaine pour 
detecter les adresses Web qui ont des mots cles qui 
correspondent aux termes de la recherche selon les operateurs 
de recherche utilises, tels que des operateurs booleens, etc. 



25 La FIG. 2 represente un exemple d' index d 1 adresse Web 14 

qui associe une adresse Web (20), un mot cle (21) et un indice 
d'audience (22), fournissant ainsi un indice d'audience a 
chaque paire adresse Web/mot cle. L' indice d'audience indique 
la frequence de selection de 1' adresse Web associee 

30 lorsqu'elle est renvoyee en reponse a une recherche comprenant 
le mot cle associe a l f adresse Web et a 1 T indice d'audience. 
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Les associations adresse Web/mot cle de l 1 index 14 
peuvent etre generees a I 1 aide d'un systeme d* indexation de 
moteur de recherche connu dans le domaine pour associer les 
adresses Web avec les mots cles utilises pour la recherche. 
5 De plus, le moteur de recherche des versions pref erentielles 
peut avoir la capacite d T associer un indice d T audience avec 
chaque paire adresse Web/mot cle. Les versions 

pref erentielles peuvent ajouter 1 T association de 1 1 indice 
d T audience aux index d f adresse Web actuelles utilisees par des 

10 moteurs de recherche. Les moteurs de recherche actuels 
associent les adresses Web avec certains mots cles figurant 
dans le titre, le document dans son entier, des marqueurs meta 
de mots cles, etc. Une fois que 1 1 index d' adresse Web est 
genere d ! une maniere connue dans le domaine, les versions 

15 pref erentielles commencent a associer un indice d 1 audience 
avec chaque mot cle pour une adresse Web donnee, autrement dit 
avec chaque paire adresse Web/mot cle. Mnsi, toute adresse 
Web peut avoir de multiples indices d' audience associes si 
plusieurs des mots cles associes a l 1 adresse Web ont fait 

20 I'objet de demandes de recherche. En 1 1 occurrence, sur la 
FIG. 2, les adresses Web "www.ibm.com" et "www . uspto . gov" 
possedent de multiples indices d' audience pour chaque paire 
adresse Web/mot cle. De nombreux moteurs de recherche 

utilisent tous les mots de la page comme mots cles. Le site 

25 de 1 'Office americain des brevets ayant 1 ! expression 
"informations generales" sur son portail, le mot cle "general" 
peut etre associe avec 1 'adresse Web de 1' Office des brevets 
(www.uspto.gov) et avoir un faible indice d T audience car peu 
de gens effectuant une recherche sur le terme "general" 
30 seraient susceptibles d'etre interesses par le site web de 
l'Office des brevets. 

L f indice d' audience peut etre associe avec la paire 
adresse Web/mot cle a l'aide d'une base de donnees et de 
techniques d f indexation connues dans le domaine. Dans les 
35 versions pref erentielles, aucun indice d'audience n'est 
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associe avec une paire adresse Web/mot cle tant que le mot cle 
ne fait pas 1'objet d'une demande de recherche dans laquelle 
1- adresse Web correspondant au mot cle est renvoyee dans les 
resultats. De cette maniere, I'indice associe peut etre 

5 ajoute aux index d'adresse Web courantes. Toutes les parres 

^ adresse Web/mot cle peuvent aussi etre initialises avec un 
indice d- audience qui est augmente ou diminue selon la 
frequence de sa selection parmi les resultats de la recherche, 
comme indique ci-apres. 

,0 A chaque fois que le moteur de recherche 12 obtient des 
adresses Web en reponse a une recherche, il genere une page 
HTML pour afficher les resultats de la recherche classes en 
fonction de I'indice d' audience de chaque paire adresse 
Web/mot cle impliquee dans la recherche. Par exemple, si la 

15 recherche a porte sur le mot cle "international" et que 
1' adresse Web "www.ibm.com" a ete renvoyee, I'indice 
d'audience de "www.ibm.com" qui sera utilisee pour determiner 
la classification sera "2", c'est a dire I'indice de la paire 
"www.ibm.com" /"international" . 

20 Apres avoir genere une page HTML pour les resultats de la 

recherche, le moteur de recherche 12 peut egalement generer un 
identifiant unique pour la page HTML, comprenant un champ 
indiquant le nombre d ' adresses Web qui ont ete selectionnees 
sur la page HTML. Le champ de 1' adresse Web indiquant le 

25 nombre d' adresses Web deja selectionnees sur la page peut etre 
utilise pour determiner 1 ' ajustement des indices d'audience de 
sorte que les adresses Web demandees en dernier aient un 
niveau de priorite inferieur a celui des resultats de 
recherche d' adresses de fichier demandes plus tot. 

30 Les FIG. 3a et 3b representent la logique implantee dans 

le programme du moteur de recherche 12 pour determiner les 
indices d'audience de chaque paire adresse Web/mot cle. Les 
indices d'audience peuvent etre programmes au depart sur une 
valeur neutre pour pouvoir les diminuer pour indiquer un 
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niveau de priorite faible pour une paire adresse Web/mot cle 
donnee. Sur la FIG. 3a, le controle commence au bloc 100, 
lorsque le moteur de recherche 12 regoit une demande de 
recherche du client 6. Le moteur de recherche 12 execute (au 
5 bloc 102) la recherche dans 1 ' index d'adresses Web 14 a l'aide 
d T un des mots cl£s et des operateurs eventuels specifies dans 
la recherche. S'il n'y a qu'un resultat de recherche, 
(reponse "non" au bloc 104), le controle passe au bloc 116 sur 
la FIG, 3b. S T il y a plusieurs resultats de recherche (reponse 

10 ,T oui" au bloc 104), le moteur de recherche determine alors (au 
bloc 108) l'indice d' audience pour chaque paire constitute 
d T un resultat de recherche d'addresse Web et d'un mot cle 
correspondant au mot cle de la recherche dans 1 ' index 
d T adresses Web 14. Ainsi, tout resultat de recherche 

15 d T adresse Web peut avoir plusieurs indices d T audience si 
l 1 index d 1 adresse Web 14 a plusieurs entrees pour 1' adresse 
Web qui correspondent aux mots cles de la recherche. Par 
exemple, sur la FIG. 2, une recherche basee sur les mots 
"computer" et "software" renverrait l f adresse Web IBM avec 

20 deux indices d f audience differents car les mots cles de la 
recherche correspondent a deux mots cles de l 1 adresse Web IBM. 

Si plusieurs indices d T audience correspondent a une 
adresse Web resultant de la recherche (reponse "oui" au bloc 

25 110), le moteur de recherche 12 calcule la moyenne (au bloc 
112) des indices d ! audience pour cette adresse Web. Ainsi, un 
seul indice d' audience, ou indice d T audience moyen, est 
associe avec chaque resultat de recherche d T adresse Web. Les 
resultats sont ensuite classes (au bloc 114) en fonction de 

30 l 1 indice unique d T audience, ou indice d'audience moyen, de 
l 1 adresse Web. D'autres methodes peuvent etre utilisees dans 
le cas ou deux indices d 1 audience sont associes avec un 
resultat de recherche d' adresse Web, par exemple en 
selectionnant l'indice d 1 audience maximum de l 1 adresse Web 

35 resultant de la recherche. 
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Du bloc 114, le controle passe au bloc 116 sur la FIG. 3b 
pour construire une/des page(s) HTML comprenant les resultats 
de recherche a renvoyer au client 6. Si tous les resultats de 
recherche peuvent tenir sur une seule page HTML (reponse "our" 
5 au bloc 116), le moteur de recherche 12 etablit (au bloc 118) 
une seule page HTML pour afficher tous les resultats de la 
recherche classes selon leurs indices d- audience et attrrbue 
un identifiant (ID) unique a cette page. Comme nous 1'avons 
indique, cet ID unique peut comprendre un champ indiquant le 
10 nombre d'adresses Web deja selectionnees sur la page, lequel 
est initialement de zero. Le moteur de recherche 12 reecrit 
ensuite (au bloc 120) l'adresse Web correspondant a chaque 
resultat de recherche en associant l'adresse Web du moteur de 
recherche et 1 * identifiant unique de la page. Si tous les 
15 resultats de la recherche ne tiennent pas sur une seule page 
HTML (reponse "non" au bloc 116 aboutissant au bloc 122), le 
moteur de recherche 12 construit plusieurs pages HTML pour 
afficher tous les resultats de la recherche classes selon 
leurs indices d' audience sur chaque page et dans 1' ensemble du 
20 document. Les resultats de la recherche sont affectes (au 
bloc 124) a une page et a chaque page est attribue un ID 
unique qui comprend un champ indiquant le nombre d'adresses 
Web deja selectionnees sur la page. Le moteur de recherche 12 
reecrit ensuite (au bloc 126) chaque adresse Web resultant de 
25 la recherche en associant l'adresse Web du moteur de recherche 
et l'ID unique auquel le resultat de la recherche est affecte. 



Une fois la/les page(s) etablie(s), a partir du bloc 120 
ou 126, le controle passe au bloc 128 ou le moteur de 
30 recherche 12 reduit l'indice d' audience de chaque paire 
adresse Web/mot cle de la premiere page comme si celle-ci 
n'avait pas ete selectionnee . La page de recherche est 
ensuite envoyee (au bloc 130) au client. Ce n 1 est qu'apres la 
selection que l'indice d' audience de la paire adresse Web/mot 



12 



2802671 



cle selectionnee est augmente. Les indices d 1 audience des 
paires adresse Web/mot cle des pages non encore envoyees au 
client 6 sont abaiss<§s lorsque la page comprenant les 
resultats de la recherche d 1 adresse Web est renvoyee au client 
5 6. Ainsi, au depart, les indices d' audience de tous les 
resultats de la page renvoyee a 1 T utilisateur sont ajustes 
comme s f ils n ! avaient jamais ete selectionnes par 
1 1 utilisateur sur le poste client 6. Seuls les adresses Web 
selectionnees voient 1 1 indice d' audience de la paire adresse 
10 Web/mot cle correspondante augmente. 

La FIG. 4 represente la logique implantee dans le moteur 
de recherche 12 pour traiter un resultat de recherche 
d'adresse Web selectionnee par 1 1 utilisateur sur la page des 
resultats. L 1 adresse Web du serveur a moteur de recherche 4 

15 etant associee a 1' adresse Web resultant de la recherche, 
c T est l 1 adresse Web reecrite selectionnee par 1 1 utilisateur et 
affichee sur la page HTML renvoyee qui est dirigee vers le 
serveur a moteur de recherche 4, et non l r adresse Web du site 
resultant de la recherche selectionnee par 1 T utilisateur . 

20 Cependant, 1 1 utilisateur est informe de la reorientation car 
il peut visualiser 1 T adresse Web du moteur de recherche dans 
1' adresse Web resultant de la recherche affichee sur la page 
HTML. Voici une exemple d'adresse Web (1) reecrite associant 
1 T adresse Web du moteur de recherche "www.searchengine.com" a 

25 1' adresse Web resultant de la recherche "www.news.com" : 
"www . searchengine . com/www . news . com" 

(1) 

Comme on peut le voir, 1 ' utilisateur du moteur de recherche 
peut clairement constater que 1' adresse Web a ete reecrite et 

30 que 1' adresse Web resultant de la recherche qu f il selectionne 
contient un lien avec le site du moteur de recherche. Pour 
garantir davantage la protection de l'intimite de 
1 1 utilisateur et s'assurer qu T il est informe de la 
reorientation, un message peut etre affiche sur la page HTML 

35 pour 1' informer du fait que la selection de 1' adresse Web va 
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le diriger vers le serveur & moteur de recherche 4 avant le 
site selectionne et que des informations sur les selections 
des utilisateurs sont collectees de maniere anonyme . 

Sur la FIG . 4, le controle commence au bloc 150, lorsque 
5 le serveur a moteur de recherche 4 regoit une demande de 
lecture HTTP de l'adresse Web reecrite du resultat de 
recherche selectionne, avec 1 T ID unique de la page sur 
laquelle 1 T utilisateur a selectionne l'adresse Web. Le moteur 
de recherche 12 appelle alors (au bloc 152) l'ID unique et 
10 augmente la valeur dans le champ de l'ID indiquant le nombre 
de resultats deja selectionnes sur la page. Le moteur de 
recherche 12 determine ensuite (au bloc 154) une valeur de 
ponderation a a j outer a l'indice d T audience qui est basee sur 
le nombre courant de selection dans le champ de l'ID. Cette 
15 augmentation doit aussi tenir compte du fait que l'indice a 
initialement ete reduit (au bloc 128) jusqu'a une valeur par 
defaut. Le moteur de recherche determine ensuite (au bloc 
156) l'indice d'audience de chaque paire constitute d'un 
resultat de recherche et d'un mot cle correspondant aux mots 
20 cles de la recherche dotes de l'indice determine au bloc 154. 
Le moteur de recherche 12 reoriente ensuite (au bloc 158) la 
demande HTTP vers l'adresse Web du site selectionnte ou 
1 1 utilisateur peut acceder directement au site. 

La methode, le systeme, le programme et les structures de 
25 donnees des versions pref erentielles offrent une technique 
pour definir l 1 audience des resultats de recherche afin de 
determiner la maniere de presenter ou de classer ceux-ci lors 
des futures recherches. De plus, les versions pref erentielles 
offrent des indices d'audience precis en associant un indice 
30 d'audience a chaque mot cle des adresses Web. Seuls les 
indices d'audience dont les mots cles correspondent aux mots 
cles de la recherche sont definis. Ainsi, les indices 
d'audience sont specif iques a chaque mot cle. Cela est 
interessant car 1' audience d'une adresse Web peut varier pour 
35 differents mots cles de recherche. Par exemple, sur la FIG. 
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2, les personnes effectuant une recherche avec les mots 
"general" et "Patton" desirent vraisemblablement visiter des 
sites web traitant du celebre general americain George S. 
Patton. Une recherche utilisant le mot "general" peut 
renvoyer a l'adresse Web de 1' Office americain des brevets 
("www.uspto.gov") parce que le mot "general" figure dans 
1- index d'adresse Web 14. Cependant, les personnes effectuant 
une recherche avec le mot "general" ne sont vraisemblablement 
pas interessees par l'adresse Web de 1' Office americain des 
brevets. C'est pourquoi 1'indice d' audience associe a 
l'adresse Web de l'Officie americain des brevets et au mot cle 
"general" peut etre faible. En revanche, 1'indice d' audience 
associe a l'adresse Web de 1' Office americain des brevets et 
au mot cle "patents" sera vraisemblablement eleve car les gens 
effectuant une recherche sur les brevets seront interesses par 
la page web de l'Office americain des brevets. 

Ainsi, les versions pref erentielles tiennent compte du 
fait que differentes paires mot cle/adresse Web peuvent avoir 
differents indices d' audience. Cette precision dans la 

definition des indices d' audience augmente les chances que la 
classification des resultats de recherche reflete avec 
precision la veritable audience des adresses Web pour une 
recherche donnee, et non des indices d' audience qui ne 
seraient pas pertinents pour les mots cles utilises. 

Les versions pref Erentielles tiennent aussi compte de 
1' audience sur une page donnee pour les resultats de recherche 
qui necessitent plusieurs pages. Comme nous l'avons indique, 
le nombre de selections est gere page a page. Ainsi, la 
premiere adresse Web selectionnee sur chaque page de resultats 
de recherche verra son/ses indice(s) d' audience pour le(s) 
mot(s) cle(s) augmente comme s'il etait la premiere adresse 
Web selectionnee. Par consequent, le fait que le moteur de 
recherche 12 detecte une adresse Web sur une page ulterieure 
n'a pas d 1 impact negatif sur 1'indice d' audience de l'adresse 
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web . ctt. carac t ,ris t i q ue des versions ^ 
compt e du fait q ue 1.. utiiiaateurs peuvent „ 1 

^ " M»i - ae recherche des pa.es 

suivantes. Ainsi, 

suivantes ,ue rutiUsateur n a pas lues 

..penalises" de rigurer sur une page ul " rl """ Meb 
indices d' audience des resultats de recherche d adresses 
qui ont ete luea par 1 ■ utilisateur sent abates. 

t . 1a Hpccription des versions 
) cette observation conclut la descripti 

p «ielles de ^^^^L ^ 
description de quelques versions alternatives 



invention, 



Les versions preferentielles peuvent etre mises en ceuvre 
15 sous forme d'une metnode, d'un appareil ou d^un produit a 
1-aide de techniques de probation et/ou de concepts 
ordinaires pour produire des logiciels, des micrologiciels, 
des materiels ou des combinaisons de ces elements. Le terme de 
"produit" (ou de "programme inf ormatique" ) designe ici un ou 
20 plusieurs programmes inf ormatiques et/ou fichiers de donnees 
~ accessibles a partir d'un ou plusieurs dispositifs ou supports 
lisibles par ordinateur, tels que des supports magnetigues, 
des disquettes, des CD-ROM, des disques optiques, des unites 
holographiques, des memoires remanentes, etc. En outre, le 
25 produit peut comprendre 1 ' implantation des versions 
preferentielles sur un support de transmission, tel qu'une 
ligne de reseau, un support de transmission radio, des signaux 
se propageant dans 1'espace, des ondes radio, des signaux 
infrarouges, etc. Bien entendu, les specialistes trouveront 
30 de nombreuses modifications qui peuvent etre apportees a cette 
configuration sans sortir de 1'objet de la presente invention. 

Les versions preferentielles supposaient une disposition 
particuliere de 1 ' index adresse Web pour permettre d'associer 
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un indice d' audience a cheque paire adresse W eb/ m ot cU. 
Cependant, les specialistes dee bases de donnees contend ont 
Cepenaa ' , . Aa n^rmettre 1' association 

que 1' alternative avait pour but de permettre 

Is indices d'audience avec les paires adresse Web/mot cle. 



-firentiPlles des indices d' audience 
5 Sur les versions pref erentielles, aes 

10 t cle/adresse Web. En 
les indices d' audience 



que 



10 



revanche, sur d'autres versions, les rndrces d au 
peuvent n'it.e donnes que pour certains mots ^ cles tels 
ceux fiqurant dens un titre, un marqueur meta de mot cle, etc. 

sur les versions pref erentielles , 1'ordre dans lequel un 
resultat de recherche d' adresse Web est selectionne est 
vermin, en utilisant l'ID unique d'une paqe avec un champ 
indiquant le no^bre de selections qui ont ete faites sur cette 

^-s^o H'snfres codes ou structures de 
page. Sur d'autres versions, d autres 

15 donnees peuvent etre utilises pour determiner comment definir 
la priorite des indices d« audience des adresses Web/mots cles 
pour une page donnee de resultats de recherche. 

Les versions pref erentielles ont ete decrites en 
envisageant le protocole HTTP pour transmettre les documents 
20 entre les ordinateurs d'un reseau. Cependant, les 

specialistes comprendront que les versions pref erentielles 
peuvent utiliser n'importe quel protocole de communication 
pour permettre a un client de demander et d'appeler des 
fichiers dans un environnement reseau. 

25 Les versions pref erentielles ont ete decrites en 

envisageant la presentation des r6sultats de recherche sur des 
pages HTML. Cependant, on peut utiliser d'autres formats de 
fichiers pour etablir des pages de type web, tels que le 
Dynamic Hypertext Mark-Up Language (DHTML), le Extensible 
30 Markup Language (XML), les Cascading Sytle Sheets, tout autre 
Standard Generalized Markup Language (SGML) ou autre langage 
dans le domaine pour creer des documents structures 



connu 
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interchangeables. De plus, on peut utiliser n'importe quelle 
version de HTML, telle que les versions 2.0, 3.2, 4.0, etc. 
Sur d'autres versions, le fichier demande peut se trouver sous 
n'importe quel autre format - autre qu'un format de type SGML 
5 - qui peut etre affiche ou execute d'une maniere quelconque 
par le client. 

Les versions preferentielles ont ete decrites en 
envisageant un environnement reseau dans lequel les pages sont 

10 fournies au client a partir d'un serveur sur un reseau tel que 
1- Internet. Cependant, sur d'autres versions, le serveur a 
moteur de recherche peut etre gere et utilise par un systeme 
informatique unique, tel qu'un ordinateur muni d'une unite de 
disque dur, pour chercher des fichiers sur le disque dur de 

15 1 'ordinateur. 

Sur les versions preferentielles, les fichiers recherches 
sont identifies par une adresse Web et peuvent se trouver sur 
differents serveurs communicant par un reseau commun tel que 
1' Internet. Sur d'autres versions, on peut utiliser n'importe 

20 quel principe d'adressage de fichiers, y compris un chemin 
d'acces de fichier indiquant 1 ' emplacement d'un fichier dans 
une unite de stockage locale. Dans ce cas, les versions 
preferentielles peuvent etre utilisees pour chercher des 
fichiers situes dans une unite de stockage locale et non 

25 disperses sur un reseau. 

En resume, la presente invention propose une methode, un 
systeme, un programme et des structures de donnees pour 
classer des fichiers inf ormatiques qui font l'objet d'une 
recherche. Au moins un mot cle est associe avec chaque 
30 fichier. Un emplacement physique de chaque fichier est 
identifie par une adresse de fichier. Un indice d' audience 
est associe avec au moins une paire constitute d'une adresse 
de fichier et d'un mot cle de telle sorte qu'une adresse de 
fichier peur avoir plusieurs mots cles associes et un indice 
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d'audience associe pour chaque paire constitute d'une adresse 
de fichier et d'un mot cle. En reponse a 1 ! execution d'une 
demande de recherche avec des mots cl6s, 1 1 utilisateur regoit 
des resultats qui ont au moins un mot cle associe qui 
5 correspond a au moins un mot cle de la recherche. Les 
resultats de la recherche sont classes selon l'indice 
d'audience associe a chaque paire constituee d T un resultat et 
d'un mot cle dont le mot cle correspond a celui de la 
recherche. Un document est ensuite code de maniere a 
10 comprendre les resultats de la recherche d'adresses de fichier 
et a les afficher conformtment a la classification. 

La description ci-dessus des versions pref erent ielles de 
1' invention est donnee dans un but d 1 illustration et de 
description. Elle ne pretend pas etre exhaustive et ne doit 

15 pas etre interpretee dans un sens limitant 1' invention a la 
forme precise decrite. De nombreuses modifications et 

variantes sont possibles a la lumiere des informations 
ci-dessus. L'objet de l 1 invention ne peut pas etre limite par 
cette description detaillee, mais uniquement par les 

20 revendications ci-apres. Les caracttristiques, exemples et 
informations ci-dessus constituent une description complete de 
la fabrication et de 1 1 utilisation des elements de 
1' invention. De nombreuses versions de 1 ! invention pouvant 
etre realisees sans trahir l T esprit ni sortir de l'objet de 

25 1' invention, cette derniere reside dans les revendications 
ci-apres . 
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RE VEN D I CAT I ON S 



1. Une methode pour classer des fichiers inf ormatiques 
qui font 1'objet d'une recherche, comprenant les etapes 
suivantes : 

association d'au moins un mot cle avec chaque fichier, un 
emplacement physique de chaque fichier etant identifie par une 

adresse de fichier, 

association d T un indice d' audience avec au moins une 
paire constitute d'une adresse de fichier et d'un mot cle, une 
adresse de fichier pouvant avoir plusieurs mots cles associes 
et un indice d' audience associe pour chaque paire constitute 
d'une adresse de fichier et d'un mot cle, 

execution d'une demande de recherche avec des mots cles 
de recherche, 

reception de resultats de recherche d'adresses de fichier 
qui ont au moins un mot cle associe qui correspond a au moins 
un mot cle de recherche en reponse a 1 T execution de la demande 
de recherche et 

classification des rtsultats de recherche en fonction de 
1' indice d ! audience associe avec chaque paire constitute d'un 
resultat de recherche d ! adresses de fichier et d'un mot cle 
dont le mot cle correspond au mot cle de recherche. 

2. La methode decrite dans la revendicat ion 1, 
comprenant en outre le codage d'un document indiquant les 
resultats de la recherche d'adresses de fichier, le document 
affichant les resultats de recherche d'adresses de fichier en 
fonction de la classification. 

3. La methode decrite dans la revendicat ion 2, un 
serveur dote d'une adresse Web de serveur executant la 
recherche et generant le document, les resultats de recherche 
d'adresses de fichier comprenant des adresse Web de resultat 
de recherche indiquant 1 1 emplacement des fichiers repartis sur 
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-i. „„r Internet et la generation du 
des serveurs interconnects par Int. d . adresse s de 

document indiquant les resultats de la recherche 

£l chier — - d ^^:::; s ; Ui w V :r e l" serveur avec chaque 

C ° mb : n rr r ul at T -nerche dans une adresse Web 
5 adresse Web de resultat 

.ombinee pour cheque resultat de ^ ultat de 

codaqe du document pour afficher cnaq 
recherche avec 1'adresse We. cornea, les demandes adressees 
^adresse Web combinee etant diriq.es vers le serve 
10 reception d'une demande adressee a 1 adresse 

'^mentation de cheque rndice d.audience asso cie avec 
cheque adresse Web de resultat de recherche dans la par e 
constitute de 1'adresse Web combine et d'un mot 
,5 correspondent aux mots cles de la recherche et 

reorientation de la demande vers 1- adresse web de 
resultat de recherche. 

4 La methode decrite dans l'une quelconque des 
revendications 1 a 3, comprenant en outre les etapes suivantes 
20 : 

determination de plusieurs indices d' audience assocxes 
avec au moins un resultat de recherche d'adresses de frchxer 
pour les resultats de recherche dotes de plusieurs mots cles 
associes qui correspondent au mot cle de la recherche, 
25 calcul de la moyenne des indices d' audience determines 

pour determiner un indice d'audience moyen pour les resultats 
de recherche d'adresses de fichier qui ont determine plusieurs 
indices d'audience, les resultats de recherche etant classes 
en fonction de 1' indice d'audience associe avec chaque 
30 resultat de recherche dote d'un seul mot cle associe qui 
correspond aux mots cles de la recherche et de 1 ' indxce 
d'audience moyen pour chaque resultat de recherche dote de 
plusieurs mots cles associes qui correspondent aux mots cles 
de la recherche. 
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5. La methode decrite dans l'une quelconque des 
revendications 1 a 4, comprenant en outre les etapes suivantes 

reception d'une demande d'acces a au moins un des 
5 resultats de recherche d'adresses de fichier affiches dans le 
document et 

augmentation des indices d T audience pour au moins une 
paire demandee constitute d'un resultat de recherche 
d T adresses de fichier et d'un mot cle correspondant aux mots 
10 cles de la recherche. 

6. La methode decrite dans l'une quelconque des 
revendications 1 a 5 f comprenant en outre la diminution des 
indices d T audience pour les paires constitutes d T une adresse 
de fichier et d T un mot cle correspondant aux mots cles de la 

15 recherche qui n ' ont pas ete demandes. 

7. La methode decrite dans l'une quelconque des 
revendications 5 et 6, le reglage de l'indice d 1 audience en 
diminution ou en augmentation etant determine par le nombre de 
resultats de recherche du document deja demandes, les 

20 resultats de la recherche d'adresses de fichier demandes en 
dernier ayant un niveau de priorite inferieur & celui des 
resultats de la recherche demandes en premier. 

8. La methode decrite dans l'une quelconque des 
revendications 5 et 6, le reglage de l'indice d 1 audience en 

25 diminution ou en augmentation etant determine par le nombre de 
resultats de la recherche d'adresses de fichier figurant sur 
un document qui ont deja ete demandes, les resultats de la 
recherche d'adresses de fichier demandes en dernier ayant un 
niveau de priorite inferieur a celui des resultats de la 

30 recherche demandes en premier. 

9. La methode decrite dans l'une quelconque des 
revendications 1 a 8, comprenant en outre la generation de 
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plusieurs documents pour reunir tous les resultats de la 
recherche d'adresses de fichier lorsque ceux-ci ne peuvent pas 
tenir dans un seul document, chaque document affichant les 
resultats de la recherche selon leur classement. 

5 10. un systeme pour classer des fichiers inf ormatiques 

qui font 1' ob jet d'une recherche, comprenant des moyens pour 
mettre en oeuvre toutes les etapes de la methode selon l'une 
quelconque des revendications 1 a 9. 

0 11. Un produit pour classer des fichiers inf ormatiques 

qui font l'objet d'une recherche, ledit produit comprenant un 
support accessible et utilisable par ordinateur et contenant 
au moins un programme informatique comprenant des instructions 
adaptees pour permettre a 1' ordinateur d'executer toute les 

5 etapes de la methode selon l'une quelconque des revendications 
1 a 9. 
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